Rank in Wordlist | Frequency | Word |
---|---|---|
948 | 1498 | прес-служба |
1058 | 1360 | Івано-Франківську |
1364 | 1088 | Івано-Франківська |
1522 | 992 | Івано-Франківської |
1795 | 860 | Євро-2020 |
2099 | 753 | прес-службі |
2149 | 739 | будь-які |
2261 | 704 | будь-яких |
2428 | 663 | Івано-Франківській |
2486 | 649 | будь-який |
3071 | 536 | 2019-го |
3122 | 527 | будь-якого |
3123 | 527 | будь-якому |
3252 | 504 | Нью-Йорку |
3353 | 490 | прес-конференції |
3359 | 489 | будь-яку |
3547 | 464 | з-під |
3549 | 464 | прем'єр-міністр |
3676 | 446 | По-перше |
3692 | 444 | Євробачення-2019 |
Rank in Wordlist | Frequency | Word |
---|---|---|
20178 | 69 | віч-на-віч |
28911 | 44 | пліч-о-пліч |
34528 | 34 | Ріо-де-Жанейро |
35046 | 34 | тет-а-тет |
36993 | 31 | Солт-Лейк-Сіті |
40633 | 27 | Бі-бі-сі |
40809 | 27 | Ростові-на-Дону |
43302 | 25 | віце-прем'єр-міністр |
45642 | 23 | Ростова-на-Дону |
48873 | 21 | віце-прем’єр-міністр |
Rank in Wordlist | Frequency | Word |
---|---|---|
135914 | 4 | Дніпро-Царичанка-Кобеляки-Решетилівка |
138210 | 4 | Нотр-Дам-де-Парі |
191816 | 2 | 70-х-80-х |
195196 | 2 | Івано-Франківськ-Надвірна-Яремче |
195613 | 2 | А-БА-БА-ГА-ЛА-МА-ГА |
195614 | 2 | А-ба-ба-га-ла-ма-га |
196238 | 2 | Ан-124-100-150 |
201780 | 2 | Доманово-Ковель-Чернівці-Тереблече |
202553 | 2 | Ет-Телль-ель-Абьяд |
216573 | 2 | Угорщина-Словаччина-Румунія-Україна |
Rank in Wordlist | Frequency | Word |
---|---|---|
195613 | 2 | А-БА-БА-ГА-ЛА-МА-ГА |
195614 | 2 | А-ба-ба-га-ла-ма-га |
263151 | 1 | 3-1-4-1-1 |
300938 | 1 | Дністровську-Василіянок-Гаркуші-Вокзал-Хоткевича-Івасюка-Тисменицьку |
305642 | 1 | Залізничній-Шухевичів-Бандери-Сахарова-Коновальця-Січових |
305643 | 1 | Залізничній-Шухевичів-Бандери-Сахарова-Чорновола |
318121 | 1 | Ма-ло-ро-сі-я |
330713 | 1 | Пассау-Відень-Будапешт-Братислава-Мельк |
341716 | 1 | Сан-Педро-де-ла-Пас |
342070 | 1 | Сахарова-Бандери-Шухевичів-Залізнична-Вокзал |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters